Análise dos dados de cancer colorretal - eventos recorrentes

Author

Camille Menezes

Published

July 3, 2024

Neste documento, duas abordagens, frequentista e Bayesiana, são consideradas para analisar o tempo até a ocorrência de múltiplas reinternações após a cirurgia de remoção do tumor de pacientes diagnosticados com câncer colorretal.

1 Análise descritiva

os dados de cancer colorretal apresentam 861 observações de 403. Desses indivíduos, 50.62% foram reinternados, 53.85% foram tratados com quimioterapia, 40.69% são do sexo feminino, 44.67% apresentam estágio tumoral A-B, 36.72% apresentam estágio tumoral C e 18.61% apresentam estágio tumoral D. É possível observar o Indice de Comorbidade de Charlson’s para esses indivíduos na figura a seguir.

Cerca de 80.14% das observações ocorreram até o terceiro evento. Para sintetizar os resultados obtidos, na análise descritiva foram consirados os tempos até a terceira internação.

Considerando todos os tempos, a primeira intenação ocorreu no 2º dia e a última no 2175º dia.

1.1 Tempo até o primeiro evento

Considerando o tempo até o primeiro evento, a primeira intenação ocorreu no 5º dia e a última no 2175º dia. As curvas de kaplan-Meier podem ser vistas no gráfico a seguir.

Valor-p do teste logrank
Valorp
chemo 0.026
sex 0.179
dukes 0.000
charlson 0.003

    Pairwise comparisons using Log-Rank test 

data:  df1 and dukes 

  A-B     C      
C 0.013   -      
D 1.2e-15 3.1e-06

P value adjustment method: bonferroni 

    Pairwise comparisons using Log-Rank test 

data:  df1 and charlson 

    0      1-2   
1-2 1.0000 -     
3   0.0015 1.0000

P value adjustment method: bonferroni 

1.2 Tempo até o segundo evento

Considerando o tempo até o segundo evento, a primeira intenação ocorreu no 2º dia e a última no 1673º dia. As curvas de kaplan-Meier podem ser vistas no gráfico a seguir.

Valor-p do teste logrank
Valorp
chemo 0.196
sex 0.009
dukes 0.000
charlson 0.004

    Pairwise comparisons using Log-Rank test 

data:  df2 and dukes 

  A-B     C      
C 0.45    -      
D 1.5e-07 3.1e-05

P value adjustment method: bonferroni 

    Pairwise comparisons using Log-Rank test 

data:  df2 and charlson 

    0     1-2  
1-2 0.021 -    
3   0.043 1.000

P value adjustment method: bonferroni 

1.3 Tempo até o terceiro evento

Considerando o tempo até o primeiro evento, a primeira intenação ocorreu no 8º dia e a última no 1572º dia. As curvas de kaplan-Meier podem ser vistas no gráfico a seguir.

Valor-p do teste logrank
Valorp
chemo 0.125
sex 0.093
dukes 0.000
charlson 0.018

    Pairwise comparisons using Log-Rank test 

data:  df3 and dukes 

  A-B     C      
C 1       -      
D 1.8e-08 1.3e-06

P value adjustment method: bonferroni 

    Pairwise comparisons using Log-Rank test 

data:  df3 and charlson 

    0     1-2  
1-2 1.000 -    
3   0.013 0.903

P value adjustment method: bonferroni 

2 Modelo completo

2.1 Abordagem frequentista

A partir da abordagem frequentista, é possível notar que todas as covariáveis, com exceção da quimioterapia, são significativas ao nível de 5%. É possível notar ainda que, ao nível de 5%, há evidências o suficiente para concluir que a variância da fragilidade não é nula e o modelo não se reduz ao modelo para dados independentes.

coef exp(coef) exp(-coef) se(coef) z p-value 2.5% 97.5%
Intercepto -6.888 0.001 980.028 0.306 -22.515 0.000 -7.487 -6.288
chemoTreated -0.012 0.988 1.012 0.119 -0.104 0.917 -0.246 0.221
sexFemale -0.380 0.684 1.462 0.114 -3.320 0.001 -0.604 -0.156
dukesC 0.311 1.364 0.733 0.134 2.319 0.020 0.048 0.573
dukesD 1.150 3.159 0.317 0.167 6.883 0.000 0.823 1.478
charlson1-2 0.606 1.832 0.546 0.220 2.757 0.006 0.175 1.036
charlson3 0.177 1.193 0.838 0.124 1.426 0.154 -0.066 0.420
gama 0.906 2.475 0.404 0.039 23.207 0.000 0.830 0.983
xi 0.145 1.156 0.865 0.070 2.082 0.037 0.009 0.282

Tomando o exponencial do seu coeficiente estimado, mantidas fixas as outras covariáveis, tem-se que:

  • O risco de reinternação dos pacientes do sexo feminino é 0.684 vezes o risco dos pacientes do sexo masculino;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.733 vezes o risco dos pacientes que apresentam estágio C;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.317 vezes o risco dos pacientes que apresentam estágio D;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.546 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 1-2;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.838 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 3.

2.2 Resíduos

2.3 Abordagem Bayesiana

Utilizando o algoritmo Adaptative Metropolis-within-Gibbs, obteve-se uma taxa de aceitação de 43.95%, próxima do considerado ótimo.

Tomando o exponencial do seu coeficiente estimado, mantidas fixas as outras covariáveis, tem-se que:

  • O risco de reinternação dos pacientes do sexo feminino é 0.686 vezes o risco dos pacientes do sexo masculino;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.76 vezes o risco dos pacientes que apresentam estágio C;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.311 vezes o risco dos pacientes que apresentam estágio D;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.526 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 1-2;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.827 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 3;

Tabela: Medidas resumo das distribuições dos parâmetros da distribuição a posteriori, do desvio e do LP.
mode exp.coef. exp..coef. Mean SD MCSE ESS LB Median UB
beta[1] -6.949 0.001 1042.107 -6.944 0.317 0.014 924.227 -7.522 -6.944 -6.333
beta[2] -0.015 0.985 1.015 -0.018 0.124 0.003 2000.000 -0.259 -0.018 0.225
beta[3] -0.377 0.686 1.458 -0.385 0.120 0.003 2000.000 -0.621 -0.385 -0.152
beta[4] 0.275 1.317 0.76 0.302 0.138 0.003 2000.000 0.032 0.299 0.581
beta[5] 1.167 3.212 0.311 1.161 0.172 0.004 1792.647 0.820 1.165 1.491
beta[6] 0.643 1.902 0.526 0.607 0.230 0.005 2000.000 0.139 0.618 1.023
beta[7] 0.19 1.209 0.827 0.179 0.126 0.003 2000.000 -0.072 0.182 0.421
gama 0.915 2.497 0.401 0.914 0.041 0.002 904.900 0.836 0.916 0.993
xi 0.169 1.184 0.845 0.191 0.080 0.002 1615.365 0.060 0.183 0.372
Deviance 7403.471 - - 7404.888 4.723 0.131 1622.999 7398.411 7404.078 7415.384
LP - - - -3737.795 2.363 0.065 1624.695 -3743.060 -3737.397 -3734.552

A partir dos gráficos a seguir e da Tabela, é possível notar que as distribuições a posteriori dos betas, gama e xi são simétricas. É possível notar também há uma notável estacionariedade, evidenciada pela ausência de tendências nos gráficos. O que indica que as amostras estão sendo colhidas de forma aleatória da mesma distribuição alvo.

Os correlogramas exibidos revelam uma escassa presença de autocorrelações significativas, sugerindo que as amostras podem ser consideradas independentes. Ou seja, as amostras geradas não são fortemente influenciadas pelas amostras geradas anteriormente.

Os desvios sugerem que a maioria das verossimilhanças foram maximizadas durante o processo, já que a distribuição é assimétrica à direita. Além disso, o correlograma não apresenta indícios de autocorrelação nos desvios das amostras.

Os logaritmos da distribuição a posteriori, das amostras indicam a sua boa adequação, uma vez que a sua distribuição é assimétrica à esquerda e o correlograma apresenta apresenta apenas três correlações significativas.

2.4 Resíduos

3 Modelo reduzido

3.1 Abordagem frequentista

A partir da abordagem frequentista, é possível notar que todas as covariáveis são significativas ao nível de 5%. É possível notar ainda que, ao nível de 5%, há evidências o suficiente para concluir que a variância da fragilidade não é nula e o modelo não se reduz ao modelo para dados independentes.

coef exp(coef) exp(-coef) se(coef) z p-value 2.5% 97.5%
Intercepto -6.895 0.001 987.494 0.290 -23.767 0.000 -7.464 -6.327
sexFemale -0.379 0.684 1.461 0.114 -3.318 0.001 -0.603 -0.155
dukesC 0.315 1.371 0.730 0.126 2.504 0.012 0.069 0.562
dukesD 1.155 3.173 0.315 0.162 7.116 0.000 0.837 1.473
charlson1-2 0.602 1.826 0.548 0.219 2.754 0.006 0.174 1.031
charlson3 0.176 1.193 0.838 0.124 1.426 0.154 -0.066 0.419
gama 0.906 2.474 0.404 0.039 23.258 0.000 0.830 0.982
xi 0.145 1.156 0.865 0.070 2.082 0.037 0.009 0.281

Tomando o exponencial do seu coeficiente estimado, mantidas fixas as outras covariáveis, tem-se que:

  • O risco de reinternação dos pacientes do sexo feminino é 0.684 vezes o risco dos pacientes do sexo masculino;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.73 vezes o risco dos pacientes que apresentam estágio C;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.315 vezes o risco dos pacientes que apresentam estágio D;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.548 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 1-2;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.838 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 3.

3.2 Resíduos

3.3 Abordagem Bayesiana

Utilizando o algoritmo Adaptative Metropolis-within-Gibbs, obteve-se uma taxa de aceitação de 44.07%, próxima do considerado ótimo.

Tomando o exponencial do seu coeficiente estimado, mantidas fixas as outras covariáveis, tem-se que:

  • O risco de reinternação dos pacientes do sexo feminino é 0.693 vezes o risco dos pacientes do sexo masculino;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.72 vezes o risco dos pacientes que apresentam estágio C;

  • O risco de reinternação dos pacientes os pacientes que apresentam estágio tumoral de Dukes A-B é 0.31 vezes o risco dos pacientes que apresentam estágio D;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.536 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 1-2;

  • O risco de reinternação dos pacientes os pacientes que apresentam índice de comorbidade de Charlson 0 é 0.837 vezes o risco dos pacientes os pacientes que apresentam índice de comorbidade 3;

Tabela: Medidas resumo das distribuições dos parâmetros da distribuição a posteriori, do desvio e do LP.
mode exp.coef. exp..coef. Mean SD MCSE ESS LB Median UB
beta[1] -6.899 0.001 991.283 -6.968 0.295 0.011 1093.123 -7.573 -6.966 -6.403
beta[2] -0.367 0.693 1.443 -0.385 0.118 0.003 2000.000 -0.619 -0.379 -0.155
beta[3] 0.328 1.388 0.72 0.317 0.131 0.003 2000.000 0.060 0.317 0.574
beta[4] 1.172 3.228 0.31 1.167 0.170 0.005 1709.159 0.846 1.165 1.506
beta[5] 0.624 1.866 0.536 0.597 0.223 0.005 2000.000 0.135 0.606 1.007
beta[6] 0.178 1.195 0.837 0.180 0.124 0.003 2000.000 -0.067 0.181 0.422
gama 0.915 2.497 0.401 0.916 0.040 0.001 1028.286 0.839 0.915 0.996
xi 0.162 1.176 0.85 0.189 0.076 0.002 1803.806 0.067 0.182 0.353
Deviance 7402.034 - - 7403.655 4.033 0.097 2000.000 7397.782 7403.005 7412.654
LP - - - -3732.806 2.019 0.048 2000.000 -3737.296 -3732.489 -3729.860

A partir dos gráficos a seguir e da Tabela, é possível notar que as distribuições a posteriori dos betas, gama e xi são simétricas. É possível notar também há uma notável estacionariedade, evidenciada pela ausência de tendências nos gráficos. O que indica que as amostras estão sendo colhidas de forma aleatória da mesma distribuição alvo.

Os correlogramas exibidos revelam uma escassa presença de autocorrelações significativas, sugerindo que as amostras podem ser consideradas independentes. Ou seja, as amostras geradas não são fortemente influenciadas pelas amostras geradas anteriormente.

Os desvios sugerem que a maioria das verossimilhanças foram maximizadas durante o processo, já que a distribuição é assimétrica à direita. Além disso, o correlograma não apresenta indícios de autocorrelação nos desvios das amostras.

Os logaritmos da distribuição a posteriori, das amostras indicam a sua boa adequação, uma vez que a sua distribuição é assimétrica à esquerda e o correlograma apresenta apresenta apenas três correlações significativas.

3.4 Resíduos

4 Comparação de modelos

Na abordagem frequentista, o teste da razão de verossimilhanças resultou num valor-p de 0.9189116. Dessa forma, não rejeitamos a hipótese nula ao nível de 5%. Ou seja, há evidências o suficiente para concluir que o modelo reduzido é mais adequado que o modelo completo. Além disso, o AIC do modelo reduzido é menor, indicando a sua melhor adequação.

Tabela: AIC e BIC dos modelos completo e reduzido para os dados de cancer colorretal.
Modelo completo Modelo reduzido
AIC 7409.446 7407.456
BIC 7429.237 7429.247

Na abordagem Bayesiana, o DIC para o modelo reduzido é menor que o do modelo completo, indicando a sua melhor adequação.

Tabela: DIC das amostras a posteriori dos modelos completo e reduzido para os dados de cancer colorretal.
Modelo completo Modelo reduzido
Dbar 7404.89 7403.66
pd 11.15 8.13
DIC 7416.04 7411.79

O fator de Bayes é 0.88, isso indica que há evidências a favor do modelo reduzido. Além disso, o modelo com todas as covariáveis precisou de 17.02h para gerar todas as amostras, enquanto o modelo sem a covariável quimioterapia precisou de 14.55h.